科研星球

基于测序数据来分析转录后调控的数据库POSTAR2使用指南

基因在从DNA变成蛋白的过程当中受到很多的调控的影响。其中主要包括:基因水平、转录水平、转录后水平、翻译水平和翻译后水平的调控,这五个水平的调控。转录后调控:是真核细胞中,将初级转录RNA转化为成熟RNA的加工过程。其中包括常规的RNA的可变剪接调控、m6A甲基化, mRNA的5’加帽和3’加尾调控及microRNA调控等等。

在转录后调控的过程,主要依赖的还是RNA绑定蛋白(RBP)。通过了解这些RBP的具体结合什么序列就知道他们的调控基因是哪些了。


POSTAR2(http://lulab.life.tsinghua.edu.cn/postar2/index.php)是一个基于测序数据来分析转录后调控的数据库。该网站包括 人类,小鼠,苍蝇,蠕虫,拟南芥和 酵母六种物种的数据。



0 (2).jpg


  • 该数据库包括m6A绑定蛋白相关基因在内的171个转录后调控因子的调控结果。

该数据库提供了以下两种检索方式:


RBP

这个功能可以通过检索指定的RNA绑定蛋白(RBP)来了解该蛋白主要和那些基因结合。进而来寻找其下游的调控基因

该模式分为基本检索和高级检索两种模式。基本检索只需要输入基因名即可。如下图:这里我们检索 TAF15基因。点击确定。


0.png


结果解读:

  1. TAF15相关信息:其中包括:TAF15基本信息TAF15的基因可能结合序列(motif)以及TAF15的基本结构


0 (1).jpg


  1. 根据测序结果,可能受到TAF15调控的基因:从中我们可以了解到: 相互作用基因的一些细胞系的表达情况以及相互作用基因的具体结合位置和来自于哪个测序数据


0.jpg


  1. 和目标RBP结合基因的富集分析

0 (3).jpg   



RNA模式

通过检索目标基因了解该基因受到哪些RNA绑定蛋白的调控。

该模式主要包括四个模块:Binding sites; Crosstalk ; Variation以及Disease

基本检索方式就是直接检索基因名即可。这里我们检索:TP53


0 (2).png


RNA: Binding sites


  • 最先看到的是,关于TP53基因的基本信息和表达情况。


0 (1).png


  • 接着可以看到:和TP53相互作用的RBP。以及具体和TP53结合的位置。包括一个网络图以及具体的结果。其中网络图当中,我们可以选择目标基因在基因UCSC的基因浏览器上查看。


0 (5).jpg


RNA: Crosstalk


这一部分提供和目标基因相关的RBP结合位点和一些转录后调控事件(如miRNA靶标,RNA修饰和RNA编辑)的相互作用信息。方式也是:直接检索基因即可

  1. 在RBP绑定位点上同时具有miRNA调控的信息。miRNA结合位点的信息来自于miRanda数据库。


0 (4).jpg


2.在RBP绑定位点上存在RNA修饰的信息:例如m6A等


0 (6).jpg


3.在RBP绑定位点上存在RNA编辑位置

0 (7).jpg


RNA: Variation


在这个部分我们可以查找在RBP绑定位点上存在单核苷酸基因突变的结果

0 (8).jpg


RNA: Disease


该模块提供位于RBP结合区域中的疾病相关SNV,包括GWAS SNP,ClinVar SNP,COSMIC数据库 SNV,TCGA全外显SNV的情况。


0 (9).jpg


简单科研思路:


    对于数据库的时候,如果你研究的是一个RNA绑定蛋白的话。那就可以用这个数据库来预测其可能结合的下游基因。这样就省去自己去做相关chip-seq的数据了。如果研究的是一个普通基因的话。但是想找其上游的调控信息。也可以通过这个数据库找一下是否存在相关的转录后调控信息。


没有账号?